Standard Deviation 方差的平方根;离散程度的同量纲度量
一、基本定义
标准差是方差的平方根,用来衡量随机变量或样本数据围绕均值的典型偏离程度。因为方差使用平方单位,标准差把量纲还原到原变量的单位,更便于解释。
若随机变量 的方差为 ,则标准差为
若样本方差为 ,则样本标准差为
二、样本标准差
给定样本 ,样本均值为
样本方差通常除以 :
除以 是因为样本均值 已经由同一批样本估计,少了一个自由度;在独立同分布抽样下,这样得到的 是总体方差的无偏估计。
例如五个年龄样本为 ,样本均值是
平方离差和为
因此
三、概率标准差
当随机变量 的取值 及概率 已知时,先计算期望
再计算方差和标准差:
例如新生年龄为 的概率分别是 ,则
方差为
所以标准差为
这表示按概率加权后,年龄围绕期望 的典型偏离量约为 岁。
四、标准化
当 时,可以把随机变量标准化:
标准化先减去均值 ,使中心移动到 ;再除以标准差 ,使离散尺度变成 。标准化后的变量满足
在正态分布、中心极限定理和统计检验中,标准差常用来描述离均值几个标准差的位置。例如标准正态分布的均值为 、标准差为 。
五、边界条件
- 标准差永远非负:、。
- 表示随机变量几乎处处等于均值;样本标准差 表示样本值全部相同。
- 当 时,标准化公式 会除以 ,不能直接定义。
- 相关系数 要求 且 ;任一变量标准差为 时,不能按该公式直接定义相关系数。
- 标准差受异常值影响,因为它来自平方偏差;需要稳健尺度时可考虑四分位距或绝对偏差等其他指标。
六、相关概念
- 均值:标准差围绕均值计算,均值决定中心位置。
- 期望:概率方差和标准差围绕期望计算。
- 方差:标准差是方差的平方根,二者描述同一离散程度但量纲不同。
- 协方差:相关系数把协方差除以两个标准差,得到无量纲的线性相关程度。